查看原文
其他

临床研究基线均衡性比较除了用P值大小来反映,还可以用这种方法!

郑卫军 医学论文与统计分析 2022-10-07

统计小食系列

(1)数据不是正态分布还能做t检验吗? 
(2)当正态、偏态、率的数据狭路相逢,如何绘制规范医学论文表格
(3)基本统计研究七宗罪,你犯了几条?来投个票吧
(4)方差分析后两两比较,究竟应该用哪种方法?
(5)再论“数据不是正态时,是否可以采用t检验?”
(6)“我的研究是基于量表的调查,如何计算样本量?”
(7)两组均数比较,可以用方差分析吗?谈谈结果一样的那些统计方法。
(8)趋势性检验还不会做?来看看最基本的趋势性检验方法


统计小食(9)


均衡性原则是指除了处理因素不同外,其他对观察结果有影响的因素应尽量一致 。


组间基线资料的均衡性是为了保证反应变量观察结果的组间可比 性,以便在相似的基线条件下考察处理因素对观察结 果的真实影响。目前基线资料均衡性的检验方法常用的是假设检验。


根据P值判断是否均衡其实不那么可靠!

假设检验的目的是通过样本对总体进行推断,而基线均衡性比较的目的是比较样本间的可比性,因此前者的意义在总体层面,后者的意义则在样本层面上。另外根据假设检验和样本量的关系可知,即使样本实 际的均衡性没有变化,随着样本量的减少,检验效能降低,也会得出较大的 P 值,即均衡性变好的假相,所以通过假设检验得出的基线“均衡”是不可靠的。此时,如果预先对基线数据进行组间比较,作者可能会选择性不报告组间差异有统计学意义的变量,而导致选择性报告偏倚。


因此在随机对照试验中,很多基线比较,干脆不需要提供假设检验和P值的结果。因为这是多余,P值是否小于0.05都不能很好说明是否均衡。


怎么办?我推荐标准化差异法 ( standardized difference ) 


而标准化差异法不再注重P值,而注重实际差别。标准化差异的定义由 Flury 和 Reidwyl 在 1986 年 首次提出。


对于连续性变量,其算法是:

可以看出,标准化差值,其实根据两组数据的均数和标准差,将差值转为类似于z值的d值。


对于分类变量,它的算法是


一般地,当标准化差异小于 0.1 时,认为组 间该变量的均衡性较好 。这一点可见于大部分的文献,有心的朋友今后可以留意一下。


总结来说,

假设检验P值,在小样本时,对不均衡性不敏感;对大样本又过于铭感。标准化差异 正是在小样本情况下也可以检验出基线资料不均衡性的方法。标准化差异同时适用于连续型变量和分类变 量的均衡性比较,且不受度量衡的影响。标准化差异 的优点还在于可以量化指标差异的大小,也可以结合示意图直观地表示。


标准化差异不仅可以用于一般组间差异性比较,还可以用于倾向评分的差异性比较和基于加权的倾向评分比较,不会受到样本量,特别是加权之后样本量的变动影响。


案例分析

比如2019年最新出版的研究慢性肾病的大队列研究中,就是用了标准化率的方法。该研究基于逆概率加权的方法进行匹配研究。

这是匹配前的基线数据,很多标准化差值都超过10%


这是匹配后的基线数据,标准化差值都小于10%


诸位,不如来尝试尝试一下!


欢迎关注本公众号,我们是资源的搬运工,所有科研资源全部免费下载:

1.  医学统计学习全套视频,妙趣+高级+SPSS+测试题,让你从入门到精通!

2.  免费下载各种文献的科研神器SCI-HUB客户端 V5.0版来了

3.问卷和量表如何统计分析?Amos亚洲一哥张伟豪"量化研究SPSS视频"下载!

4.  2006-2018中国卫生统计年鉴合集

5.  公共卫生研究必备:5次国家卫生服务调查100万居民分析报告

6.  精选的meta分析视频来了!

7.  “30 天学会R 语言”30篇学习文章合集来了,欢迎坚持从零开始学习!

8. 重磅推出2019年45份大健康产业研究报告

9.精选R语言入门学习资源:视频+文档,初学者者必备!

10.中国70年人口变化数据:1949-2018《中国人口就业统计年鉴》


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存